speedup相关论文
In this paper, an optimum tactic of multi-grid parallel algorithm with virtual boundary forecast method is disscussed, a......
长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能......
In this paper, we present the defini-tion of maximum loop speedup, which is the metricof parallelism hidden in loop body......
We investigate the quantum speed limit time (QSLT) of a two-level atom under quantum-jump-based feedback control or homo......
In this paper, an optimum tactic of multi-grid parallel algorithm with virtual boundary forecast method is disscussed, a......
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个......
Firstly, with the discusses of main ingredients to exert the peak float performance for currently high performance mirc......
针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算......
An optimal algorithmic approach to task scheduling for,triplet based architecture(TriBA),is proposed in this paper.TriBA......
The performance gap between softwareDSM systems and message passing platforms prevents the prevalence ofsoftware DSM sys......
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7......
Quasi-real-time simulation of rotating drum using discrete element method with parallel GPU computin
Real-time simulation of industrial equipment is a huge challenge nowadays.The high performance and fine-grained parallel......
Performance Analysis of Accelerator Architectures and Programming Models for Parareal Algorithm Solu
Increasing needs for the study of complex dynamical systems require computing solutions of a large number of ordinary an......
为了使得算法对蚁群进化的控制更加直接、算法更加高效,针对加权MAX-SAT的特点,以重离散化方式简化蚁群算法模型,提出取值概率的概......
针对提速后的小唐河大桥,运用动力检测方法,对其梁跨中的动挠度、横向振幅、横向及竖向加速度、振动频率,梁端横向振幅,墩顶横向振幅、......
为了更好地为电池行业服务,创刊于1998年的<电池快讯>月刊在2002年提速了,它扩大了版面,增加了信息量,新出版的<电池快讯>月刊将更......
在集群环境下,研究了相控阵雷达相干视频并行仿真方法。该方法根据相控阵雷达一个调度间隔多个雷达任务不相关的特点,提出了一种粗粒......
文中首先介绍了中国气象局武汉暴雨研究所高性能计算机应用现状和目前的模式业务系统,针对气象预报模式精细化对计算能力的更高需求......
利用区域分解方法,对模拟大气重力波在中高层大气中非线性传播过程的数值模式进行了并行化处理,从而建立了并行数值模式.在两个并行机......
可扩展性是并行计算系统的重要性能指标,虽然异构系统越来越普遍,但对其可扩展性的研究还很少。给出了一种既适合同构并行计算系统......
提出了计算一类连续运算的一种更有效的并行算法,当N足够大时,其加速Sp≈p/2,效率Ep≈1/2。在此基础上建立了求解一阶线性递归方程组的一种新算法......
提出了基于软相关的12通道GPS软件接收机实时化的改进方法,主要针对耗时较多的信号检测模块和相关器进行算法优化和程序优化,并给......
在评价多核CPU加速比已知模型的基础上,基于第一性计算原理融合理解阿姆达尔定律和兰特法则,提出描述多核CPU加速比的一个新模型.......
调度算法是决定交换结构性能和实现复杂度的重要因素,极大匹配算法在这两方面存在不足.本文提出一类广义极大匹配(EMM)算法,使用不同权......
对PC局域网上PVM分布式编程环境中网络并行计算的性能进行了详尽分析与评估,指出:在PVM编程环境中网络并行计算与MPP并行计算的根本 区别在于它......
采用SystemC建立了一个基于共享总线的MPSoC仿真平台,设计了3个实验分别用于建模3种典型应用(低计算,通讯比、高计算,通讯比和非独立任......
用传统的串行算法进行矩阵相乘运算会受到矩阵规模、单机的CPU主频、内存大小和存储器空间等方面的限制。而使用并行算法是解决上......
在视频压缩中存在大量可并行的计算如DCT/IDCT、运动估计、运动补偿、量化/反量化等,它们占计算量的主要部分,特别是DCT和运动估计......
针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或......
给出了超立方多处理机系统上大型线性方程组并行迭代求解算法设计及其运行时间复杂性分析,并在并行虚拟环境(PVM环境)下做了数值试验,求出......
并行计算是解决复杂大规模工程计算问题的有效方法。现提出了一种基于带控制器并行结构模型的并行微粒群算法,它是一种粗粒度的并......
随着芯片集成度快速提高,带有交叉缓存(crosspoint buffer)的cicq(Combined Input and Crossbar Queued switch)交换机引起了人们的广泛......
以子结构模态综合分析为基础,提出一种求解大型结构特征值问题的并行解法.采用子结构模态综合算法,结构特征模态采用子空间迭代方式并......
本文首先介绍了与多处理机多任务并行计算有关的概念以及反映加速比上界的Amdahl法则。然后,采用循环分裂的静态负载平衡方法,在国产巨型并......
本文介绍了由B.Lester博士研制的并行程序设计学习和研究工具Multi-Pascal。它允许用户在微机上编写和调试不同类型的并行程序,考察并行算法在各种并行计......
为解决大规模地下水流数值模拟参数估值计算时间过长的问题,基于粗粒度任务分解方法,采用消息传递接口(message passing interface,......
针对现代高性能多核处理器的设计周期长、复杂性高、难度大、软件开发相对滞后等一系列问题,文中设计与实现了针对西安邮电大学自......
集中式并行分组交换算法(Centralized Parallel Packet Switch Algorithm,CPA)和分布式并行分组交换算法(Distributed Parallet Pa......
随着图形处理器(GPU)的处理能力的不断增强,图形处理器越来越多的运用在计算密集型的数据处理中。AVS标准视频压缩算法中一些步骤存在......
提出了一种新的基于对角划分的矩阵乘并行算法,它在以往行列划分策略的基础上,采用基于对角划分的策略.数值试验表明该算法具有较......
传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确。随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究......
分析了7号方坯连铸机高效生产中存在的问题,介绍实施的提高拉速、事故控制与预防、提高作业率、辊道热送等措施,在确保安全可靠、......
本文对Amdahl's法则进行了量化分析,通过它的表达式,得到了卫个精确的对整机性能价格比的计算,并由此推导出一个结论:当仅对计算机的一部分改进......
理论与实证研究表明,用"一、二产业产值比例"、"人均国内生产总值"、"城市化率"、"一、二产业就业比例"四个指标加权综合测度我国......
针对典型图像特征提取算法SURF速度偏慢的问题,深入分析该算法在运行时间、指令类型、内存访问、热点等方面的特性。在此基础上,运......
Along with the unbounded speedup and exponential growth of virtual queues requirement aiming for 100% throughput of mult......
Along with the unbounded speedup and exponential growth of virtual queues requirement aiming for 100% throughput of mult......
A class of rapid algorithms for independent component analysis (ICA) is presented. This method utilizes multi-step past ......
并行处理是获得高性能计算机的有效而必要的手段,因而成为新一代计算机的结构特征。本文提出了考虑cahe 开销的加速比模型,并从理论和实......
首先研究了并行计算技术,然后对现行仿真系统中的并行算法、模型分配等机制进行分析,提出优化方法和设计评估方法,实现了一种实体运动......